Evaluation of Various DR Techniques in Massive Patient Datasets using HDFS
نویسندگان
چکیده
The objective of comparing various dimensionality techniques is to reduce feature sets in order group attributes effectively with less computational processing time and utilization memory. reduction algorithms can decrease the dataset consisting a huge number interrelated variables, while retaining dissimilarity present as much possible. In this paper we use, Standard Deviation, Variance, Principal Component Analysis, Linear Discriminant Factor Positive Region, Information Entropy Independent Analysis using Hadoop Distributed File System for massive patient datasets achieve lossless data acquire required knowledge. experimental results demonstrate that ICA technique efficiently operate on eliminates irrelevant without loss accuracy, reduces storage space also computation compared other techniques.
منابع مشابه
using game theory techniques in self-organizing maps training
شبکه خود سازمانده پرکاربردترین شبکه عصبی برای انجام خوشه بندی و کوانتیزه نمودن برداری است. از زمان معرفی این شبکه تاکنون، از این روش در مسائل مختلف در حوزه های گوناگون استفاده و توسعه ها و بهبودهای متعددی برای آن ارائه شده است. شبکه خودسازمانده از تعدادی سلول برای تخمین تابع توزیع الگوهای ورودی در فضای چندبعدی استفاده می کند. احتمال وجود سلول مرده مشکلی اساسی در الگوریتم شبکه خودسازمانده به حسا...
evaluation of sadr eminence in safavid period
چکیده: یکی از دوره های مهم تاریخی ایران به لحاظ تأمین استقلال ملی مذهبی و حتی تأثیر آن بر فرهنگ و مذهب ایرانیان، دوره صفویه است. رسمیت دادن و رواج مذهب شیعه توسط شاه اسماعیل اول، یکی از مهمترین اقدامات این دولت محسوب می شود. بنابراین برای اجرای این سیاست، وی منصب صدارت را به عنوان منصبی مذهبی- حکو متی ایجاد کرد .این منصب از دوره ی تیموریان ایجاد شده بود ولی در اواخر این دوره اهمیت بیشتری یافت...
15 صفحه اولMassive Datasets in Astronomy
Astronomy has a long history of acquiring, systematizing, and interpreting large quantities of data. Starting from the earliest sky atlases through the first major photographic sky surveys of the 20th century, this tradition is continuing today, and at an ever increasing rate. Like many other fields, astronomy has become a very data-rich science, driven by the advances in telescope, detector, a...
متن کاملA Comparative Analysis of Various Clustering Techniques on Random Datasets
ata Mining is a discovery of knowledge used basically used for finding or exploring the new facts among datasets. It allows the user to find the hidden data among available datasets. Data mining consists of various components including clustering, classification, association rules, sequence analysis etc. Unlabeled data are becoming common and mining such databases becomes more challenging. Clus...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: International journal of recent technology and engineering
سال: 2021
ISSN: ['2277-3878']
DOI: https://doi.org/10.35940/ijrte.d6508.1110421